从转专业申请数据看校内专业热度

姓名:杨涛

学号:1813580

案例背景

问题背景描述

案例背景: 同学们进入大学后,经过一年的学习和生活,对于未来的规划更为清晰,同时对所学专业有了一定认识,自然有部分同学对所学专业不够喜欢,有转专业的需求。转专业原因可能各不相同:高考发挥失利没能进入自己心仪专业,进入了心仪专业却发现根本不是那么回事,或者发现其他专业就业及薪金待遇更好,于是变心了……希望基于我校前几年转专业申请数据,分析校内专业热度排名。

南开大学转专业工作一般于每年四月启动,原则上面向大一和大二年级学生。学生可根据各接收学院公布的接收专业名额和条件提出转专业申请,经所在学院备案,接收学院考核择优选拔后,报教务处核准执行。学生考虑转专业的原因很多,有在大学中认清学习方向,有的是录取时候被调剂,有的是受其他人的影响。学生转专业的去向一般是热门专业和高薪专业,或者是对某个专业的热爱向往,导致了转专业的过程。

基于以上分析,从转专业申请数据一定程度上能够看出某个专业的热门程度和洞察转专业制度上的潜在规律,然后进行逐年的分析,然后获得转专业变化情况,对实际的学习生活进行更好的指导。

解决方案

通过三年的转专业数据,本词案例构建的网络有两个层级,专业与专业之间的网络,学院与学院之间的网络,分别把转专业学生的专业和专业所在学院看做图的顶点,如果是相同专业或学院的则连成一条边。建立专业与专业之间的关系图,并分析转专业学生的转入院和转出院之间的关系。从而构建邻接矩阵,由初始值出发,使用Pagerank算法进行迭代:

输入: 含有 n 个结点的有向图,转移矩阵 M, 阻尼因子 d, 初始向量 R0; 输出: 有向图的 PageRank 向量 R

(1)令t=0

(2) 计算 Rt+1=dMRt+1dn1

(3) 如果 Rt+1Rt 充分接近,令 R=Rt+1, 停止迭代。

(4) 否则, t=t+1, 执行步 (2)。

从而进行预测和专业热度的排序,最后引入了一些其他度量网络中节点Centrality的方法。

数据展示

数据为2018,2019,2020年申请转专业的数据,数据已经进行脱敏处理,只涉及到转入转出的专业学院,不涉及到个人信息,展示如下:

本作业的学习目标包括:

  1. 学习如何对数据进行描述性分析;
  2. 学习如何通过PageRank算法进行排序。`

任务1

各专业申请转入人数情况,各专业申请转出人数情况(是否需要分文理?)

按年做分析,看是否有变化。最后也可合并在一起。

转入

转出

任务2

采集各专业方向学生薪金待遇,考察转出专业与转入专业薪金差距。

任务3

利用PageRank对专业进行排名(分文理?)

按年做分析,看是否有变化。最后也可合并在一起。

提示:

  1. 以学院对标网页,有一个学生转入即表示该学院对相应学院有指向链接;
  2. 建立你认为合理的专业向往矩阵A,定义专业自判断向量;
  3. 利用igraph包,使用PageRank算法进行排序

由上面的得到三个不同方向的转专业学生心中的热门专业:

任务4

Degree

度排名前五的为:经济学类,化学类,法学,物理学类,旅游管理类。

Closeness

Betweenness

由于转专业,不管转出,转入也好,经济学类,物理学类,法学,化学类和计算机科学与技术是人员流动比较大的专业。